ChatGPT發佈距今已近36個月,面對OpenAI的領先,哈薩比斯帶領GoogleAI全面反攻,通過新發佈的Gemini 3強勢回歸。Gemini 3在LM Arena等多個模型榜單登頂,表現優於GPT-5及其他模型,上演了一場完美逆襲。大模型排行榜,你方唱罷我登場。馬斯克的Grok 4.1剛登頂,隨後就被Gemini 3 Pro反超了,上演了一幕AI版的「速度與激情」!Google DeepMind CEO哈薩比斯(Demis Hassabis)哈薩比斯在X平台上興奮地曬出Gemini 3的成績單,稱其「當然地」登頂各大排行榜,並表示這是自己迄今為止最愛的模型。就連奧特曼和馬斯克,也紛紛為Gemini 3點贊。馬斯克連發兩個哭泣的表情包:看來我們要盡快推Grok 4.2了。新發佈的Gemini 3具備領先的推理、多媒體處理和編碼能力,擅長推理、生成視訊和寫程式碼。Google強調,Gemini 3不只是一個更聰明的模型或聊天機器人,更重要的是它從發佈之日起,就開始全面增強Google現有產品,包括其利潤可觀的搜尋業務。它是Google這台龐大的賺錢機器的AI引擎,用哈薩比斯的話說:「我們是Google的動力引擎,現在我們正在讓AI全面接入」。哈薩比斯認為目前確實可能存在AI泡沫的問題,比如許多尚未經過檢驗的初創公司卻拿到了數十億美元的估值。但在他看來,即便是AI泡沫真的破裂,Gemini 3也讓Google有了穿越這場泡沫的底氣。把Google搜尋塞進GeminiGoogle內部,一直有一個把Google搜尋「塞」進Gemini的想法。這一想法,甚至可以追溯到Google早期。當時的Larry Page和Sergey Brin就設想過把整個網際網路都放進AI的「記憶」中,然後再對外提供服務。因此,Google在上下文方面做了大量實驗,並將上下文窗口提升到了100萬個token,目前這個記錄仍沒真正被人打破。哈薩比斯認為,機器理論上可以擁有比人類多幾百萬倍的儲存/記憶空間,但如果只是「天真地」把所有東西暴力存下來,其實並不高效。因此,與Google搜尋「塞」進Gemini相比,Google更多是把Gemini作為現有產品的底層模型向使用者開放。此次Gemini 3一發佈,Google已經正式通過Gemini應用,以及Google搜尋中的AI Overviews功能向使用者開放。據Google母公司Alphabet在7月的季度財報中表示,AI Overviews推動搜尋查詢量提升了10%。同時,Google視覺搜尋也出現了70%的激增,這項功能依賴於Gemini對照片的分析能力。與OpenAI相比,Google的優勢在於其產品「家底」深厚。它擁有包括搜尋、Google地圖、Gmail、雲服務等非常廣泛的基礎產品線。而且,Google很早就開始利用AI來增強其已有產品的能力。這使得它在與OpenAI、xAI、Anthropic等AI廠商的競爭中進可攻,退可守。哈薩比斯表示,「在不利的情況下,我們會更加依靠這些基礎產品;在有利的情況下,我們擁有最全面的佈局和最具前瞻性的研究。」Google也在考慮通過Gemini重啟Google眼鏡(Google Glass)項目。哈薩比斯表示,當時Google眼鏡步子邁得有點超前,缺少一個真正的「殺手級用例」,而通用助手正是這樣一個用例。因此,未來Gemini也將啟動Google以往積累下來的「經驗和遺產」,但是重點會放在「世界理解」上。以Gemini為例,Google一開始就將機器人和眼鏡視為兩個非常重要的應用場景,因此決定走多模態路線。如今,這些押注正在逐漸顯現出成果,Gemini已經在多模態理解上顯現出明顯優勢。除了用AI增強現有和以往的產品之外,Google也在積極利用AI打造越來越受歡迎的新工具。比如,NotebookLM,它可以根據文字材料自動生成播客;AI Studio,可以借助AI快速生成應用原型,等等。此外,Google還探索將這項技術應用到遊戲、機器人等領域。哈薩比斯提到GoogleAI的一個優勢,目前所有產品已經完全跑在Gemini技術堆疊上,實現了從產品到模型的「一體化」。這意味著無論是產品改動,還是模型微調都會容易很多,而且產品也可以更好地學會理解和使用底層模型。目前,哈薩比斯的重要精力,一半是將Gemini應用進一步加速做強,另一方面是將AI融入Google的各條業務線,使之成為Google的「AI動力艙」。「我對這一切非常興奮,目前我們只是剛剛觸及未來可能性的表面,明年會更直觀地看到這些變化」。哈薩比斯表示。被OpenAI「搶跑」後Google正快速趕上Google在AI領域長期投入巨大資源,並取得了一系列關鍵性突破。包括在2017年發現了Transformer模型架構,但沒有將其商業化,而是選擇把它公開。一直到2022年,OpenAI基於Transformer的ChatGPT爆火,動搖了Google的核心搜尋業務,才令它深受震動,開始奮起直追。有意思的是,OpenAI的崛起,不僅喚醒了Google在AI領域的加速發展,甚至還間接幫助Google避免了被分拆,出售其搜尋業務的命運。如今,Google的搜尋業務不僅沒有被OpenAI等AI新勢力所顛覆,相反它的AI模型還實現了對後者的反超。與Gemini3相比,OpenAI在8月份發佈的GPT-5令人略顯失望。一些評論者認為它「表現平平」,使用者也抱怨其風格變得更正式。據Google表示,Gemini 3在LM Arena等多個模型榜單上的表現優於GPT-5及其他模型,尤其在模擬推理以及長時間規劃方面表現更佳,這有助於提升依賴工具或網際網路的AI智能體的實際能力。在早期的AI競賽中,經歷過一些磕磕絆絆之後,Google總算是「漸入佳境」了。從使用者活躍度上看,Gemini應用的月活使用者已超過6.5億,僅次於ChatGPT的7-8億周活使用者(如果換算成月活可能在10億以上)。每月有超過20億人通過搜尋裡的AI Overviews使用Gemini;還有約1300萬開發者在自己的產品中整合了Gemini。這些數字表明Google正在逐漸縮短與OpenAI在AI領域的差距,作為GoogleAI總負責人的哈薩比斯也可以鬆口氣了。各方面都最強才叫AGI實現還要5-10年哈薩比斯表示,Google仍然在追求做「各方面都最強」的模型。在他看來,這才是真正意義上的通用模型,也是最終通向通用人工智慧(AGI)系統的關鍵組成部分。從之前的幾個版本到Gemini3,Google一直在修正Gemini模型的一些短板,使其在程式設計、推理、數學等能力上更進一步。比如,此次Gemini 3就在2.5之上迭代,一方面升級它的基礎能力,另一方鞏固在多模態領域的優勢。哈薩比斯認為未來AI的技術路線會越來越收斂,而擁有一個通用、全能的基礎模型將是一切的地基。除此次發佈的Gemini3 Pro外,Gemini模型家族裡的其他成員也在打磨中,等到這些模型陸續就位之後,Google還將在產品分層服務上提供更大的靈活度。簡單來說,就是更強的性能,更低的價格。正如哈薩比斯所言:「大方向是每一代新模型,都要在整體能力上更強,同時所需算力更便宜、更高效,帶來更有競爭力的價格和更低的時延」。目前,哈薩比斯在世界模型研究上花時間最多,在他看來這是通往AGI的關鍵元件。同樣,他也認為未來世界模型也將迎來類似ChatGPT那樣的「爆發時刻」。但最大的挑戰是推理/服務成本,以及還要解決在更長時間尺度上保持世界一致性等關鍵難題,才能迎來真正的「破圈」時刻。哈薩比斯表示,目前世界模型已經有了一些內部用例,比如用來訓練其他智能體、機器人系統等。未來可能會出現一些非常酷的外部應用場景。哈薩比斯仍然堅持他對通用人工智慧(AGI)時間表的預測。他認為距離真正意義上的完全實現AGI還有五到十年,而Gemini 3將成為未來打造更強大AI的重要平台,還需要在現有模型不斷變強的基礎上再取得一兩次關鍵性突破。在通往AGI的路上,哈薩比斯同樣也有算力焦慮。他坦言「即便將現在全世界的算力加在一起,也不夠滿足我們想做的所有事情」。因此,需要在不同項目之間衡量算力投入的回報。比如,研究上的收益、新產品探索的價值,或是直接的收入等。除了追求AGI,哈薩比斯還在帶領DeepMind在AlphaEvolve等一些科學領域進一步擴展。穿越AI泡沫的底氣談到AI泡沫,哈薩比斯整體上還是比較樂觀的,但他認為仍然存在一定的泡沫。「那些幾乎沒有什麼的項目,種子輪估值就能到幾十億美元,這在邏輯上有點行不通。」對比這些泡沫,哈薩比斯認為Google的位置非常好。就DeepMind而言,既有紮實營收,同時又承擔著Google「AI動力艙」的重任;既有Gemini模型及App,還有基於Gemini的NotebookLM等AI優先產品。哈薩比斯表示,目前AI已經在Google現有業務中看到了立竿見影的回報:正在為搜尋、YouTube、雲等業務「加功率」。作為DeepMind的聯合創始人,哈薩比斯早在12年前選擇與Google「聯手」時,已經考量過雙方合作的價值:Google可以提供海量的算力資源,同時它的產品又天然適合用AI去增強。目前,這條路正一步步變成現實。在哈薩比斯看來,Google與DeepMind的結合,讓現在的Google在AI競爭中處於一個非常有利的位置,使它有機會穿越泡沫,笑到最後。 (新智元)